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Abstract of DE1 9710252 

The processing system 11 has a number of parallel processors 12. Instruction routine execution data is 
collected 13 and used to generate a processing profile in the form of a series of reports. This allows the 
various routines to be classified. The execution time data is summed 14 and a statistical evaluation made. 
A graphical representation is made that shows maximum, minimum, average and standard variation of the 
execution times of the routines. 
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Prufungsantrag gem. § 44 PatG ist gesteilt ' " 

(fj) Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -Analyse in einem 
Parallelrechnersystem 

<§) Es wird ein Verfahren der sichtbaren Darstellung von 

Ergebnissen der Leistungsuberwachung und -analyse fur ein 

Parallelrechnersystem beschrieben, bei dem eine Vielzahl 

von Prozessoren ein parallel verarbeitendes Programm aus- 

fuhren, welches aus einer Vielzahl von Routinen zusammen- 

gesetzt ist. Zuerst werden Informationen hinsichtlich der 

Ausfuhrungszeit von jeder Routine in einer Realzeitweise 

gesammelt, wahrend das Programm gleichlaufend durch die 

Vielzahl von Prozessoren ausgefuhrt wird. Zweitens werden 

Maximal-, Mittel- und Minimalwerte der Ausfuhrungszeit 

von jeder Routine berechnet, basierend auf den Informatio- 
nen, die fur die Vielzahl der Prozessoren gesammelt wurden. 

Drittens werden die gesammelten Informationen in Form 

eines Ausfuhrungsprofils zusammengefaBt Oder summiert 
^ und werden in graphischer Form dargestellt, und zwar unter 

Verwendung von Balkengraphiken, Kreisgraphiken Oder Ra- 
CM darkarten. Fur jede Prozedur Oder Programmschleife klassifi- 
LO ziert das vorliegende Verfahren die Prozentsatze der Anwen- 
*N der-Netto-Programmausfuhmng, Kommunikation, Synchro- 
O nisation und anderer parallel laufender Zusatzaufgaben, und 

zeigt auch deren Abweichungen an. Dieses Merkmal unter- 
f> stutzt den Anwender darin, das aktuelle Programmvemalten 
O) zu verstehen und das parallel verarbeitende Programm 
^ abzustimmen. 
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Beschreibung 



H1NTERGRUND DER ERFINDUNG 

5 1. Gebiet der Erfindung 

Die vorliegende Erfindung betrifft ein Verfahren zur sichtbaren DarsteUung von Ergebnissen der leistungs- 
uberwachung und -analyse in einem Parallelrechnersystem, welches erne Vielzahl von Prozessoren verwendet 

,o undbetrimslezieUereinVerfahrenzursichtbarenDarstellungv^on 

-analyse in einer bedienungskomfortableren und umfassenden Weise. Die ^ 9 ^^ Dd ?*^^J^l 
ein computer-lesbares Medium, welches mit einem Computerprogramm codiert ist, bei welcbem das zuvor 
genannte Verfahren realisiert wird 

15 2. Beschreibung des verwandten Standes derTechnik 

Parallele Verarbeitungstechniken spielen eine entscheidende RoUe bei der Befriedigung _von .heuttuuge 
wachsenden Anf orderungen nach Hochleistungsrechnersystemen. Em ^f'^^^^^^Z 
dung aus, indem es eine Vielzahl von Prozessoren verwendet, die parallel laufen, wodurch em hoher Verarbei- 

20 tungsdurchgang erzielt wird Die Entwicklung von Software fur ein htdHnd«^ 

allgemeinen einige Schwierigkeiten bei der Programmaustestung, Bewertung und Leistungsabstunmung mit 

sich,undzwaraufgrundderenkomplexerNatur. „ r , . _^ , . 

Um das Problem zu losen, werden Leistungsanalysierer als em gunstiges Werkzeug emgerunrt, weicnes aie 
Software-Programmierer darin unterstutzt, das Verhalten eines Parallelprogramms beimTesten zu uberwachen 

25 und dessen Leistung zu messen. Der Analysierer verarbeitet die gesammelten Daten und prasentiert aas 
ErgebnisdemAnwenderinForm eines aufsummierten Ausfuhrungsprofils. , 

Ein herkommlicher Leistungsanalysierer erzeugt ein AusfOhrungsprofil von emzelnen Prozessoren, we Iches in 
solcher Weise aufsummiert ist, daB die gesamte Verarbeitungszeit m emige Kategonen klassifiziert ist, entnai- 
tend Netto-Betriebszeit und Leerlaufzeit usw. Das Ausfuhrungsprofil jedes Prozessors wird getrennt m Form 

30 einer Balkengraphik oder ahnlichemdargestellL m , „ . _ . . 

Dieses herkommliche Verfahren der DarsteUung von Ausfuhrungsprofilen ist jedoch fur Software-Entwicle- 
lungsingenieure in keiner Weise vorteilhaft, wenn das Parallelverarbeitungssystem hunderte yon Prozessoren 
enthalt Die an einem Analysierer-Bildschirm dargesteUten Informationen and zn umfangreich, um das Pro- 
grammverhalten richtig verstehen zu kSnnen, da zu vtele Prozessoren parallel laufen. In einem solchen hall Kann 

35 der herkSmmliche Analysierer die Schwierigkeit dadurch etwas mildern, indem erne gewisse statotoche Verar- 
beitung hinsichtlich der gewonnen Rohdaten angewandt wird. Dies erlaubt es, das Gesamtprogrammverhalten 
oder die mittlere Leistung der Prozessoren den Ingenieuren in emerveretaiKlhcheren Artdarzubieten. 

Jedoch sind die Informationen, die durch diesen herkommUchen Leistungsanalysierer vorgesehen werden, fur 
die Software-Entwicklungsingenieure nicht ausreichend, um die Systemqualitat bzw. Leistung vollstandig ver- 

40 stehen zu konnen und die detaillierte Beziehung zwischen den Prozessen verstehen zu kSnnen, die parallel 
laufen. 

ZUSAMMENFASSUNG DER ERFINDUNG 

45 Unter Einbeziehung des oben gesagten, besteht eine erste Aufgabe der vorliegenden Erfindung darm, ein 
verbessertes Verfahren zur sichtbaren DarsteUung von Ergebnissen der Leistungsuberwachung und -anajrse m 
einem Parallelrechnersystem zu schaffen, welches Prozentsatze der Anwender-Netto-Progranmiausfiuirung, 
Kommunikation, Synchronisation und anderer paraUel ablaufender Organisationsaufgaben zeigt als auch deren 
Abweichungen anzeigt 

so Es ist ein weiteres Ziel der vorliegenden Erfindung, ein verbessertes Verfahren zur sichtbaren DarsteUung von 
Ergebnissen der Leistungsuberwachung und -analyse in einem Parallelrechnersystem zu schaffen, welches dem 
Anwender die Moglichkeit bietet, Software-Routinen in einem parallel verarbeitenden Programm zu bewerten, 
und zwar uber eine problemlose und vorteilhafte graphische Wiedergabe des Ausfuhrungsprofils. 
Um die genannte Aufgabe zu losen, schafft die vorliegende Erfindung ein Verfahren zur sichtbaren Darstel- 

55 lung von Ergebnissen der Leistungsuberwachung und -analyse in einem Parallelrechnersystem, bei dem eine 
Vielzahl von Prozessoren ein parallels Verarbeitungsprogramm ausfuhren, welches aus einer Vielzahl von 
Routinen zusammengesetzt ist Das Verfahren umfaBt die folgenden Schritte: 

(a) Sammeln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine, die gleichlaufend durch 
60 eine Vielzahl von Prozessoren ausgefflhrt wird, unter Berucksichtigung der KJassifizierung der Routinen; 

(b) Ableiten eines Maximaiwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabweichung 
der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fttr die Vielzahl der Prozesso- 
ren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-Information, welche den Maximalwert, den Mittelwert 
65 und den Minimal wert und die Standardabweichung der Ausfuhrungszeit jeder Roudne enthalt 

Um speziell das weitere Ziel, welches oben erliutert wurde, zu erreichen, wird ein Verfahren zur sichtbaren 
DarsteUung von Ergebnissen der Leistungsuberwachung und -analyse fur ein Parallelrechnersystem geschaffen. 
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GemaB dem Verfahren werden Ausfuhrungsprofil-Informationen in Form von Balkengraphiken, Kreisgraphi- 
ken oder Radarkarten dargestellt 

Weitere Ziele neben den obigen, MerkraaJe und Vorteile der vorliegenden Erfindung ergeben sich aus der 
folgenden Beschreibung in Verbindung mit den beigefugten Zeichnungen, die eine bevorzugte Ausfuhrungsform 
der vorliegenden Erfmdung als Beispiel veranschaulichen. 

KURZBESCHREIBUNG DER ZEICHNUNGEN 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, welcbes ein Sichtdarstellungsverfahren 
gemaB der vorliegenden Erfindung verwendet; 

Fig. 2 ist ein FIuBdiagramm, welches einen ProzeB der Modifizierung und Kompilierung eines Programms 
zeigt welches fur ein Parallelverarbeitungssystem geschrieben wurde; 

Fig. 3 ist eine Tabelle, in der Laufeeit-Subroutinen aufsummiert sind, die fur eine Leistungsuberwachung und 
-analyse vorgesehen werden; 

Fig. 4 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 1 beschreibt; 

Fig. 5 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine #2 beschreibt; 

Fig. 6 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine #3 beschreibt; 

Fig. 7 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine #4 beschreibt; 

Fig. 8 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 5 beschreibt; 

Fig. 9 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 6 beschreibt; 

Fig. 1 0 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 7 beschreibt; 

Fig. 1 1 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine #8 beschreibt; 

Fig. 12 ist eine Tabelle, in der die Informationen aufsummiert sind, die durch das Leistungsanalysierersystem 
der vorliegenden Erfindung zu sammeln sind; 

Fig. 13 ist ein Diagramm, welches ein erstes Beispiel einer Ausfuhrungsprofilanzeige gemaB der vorliegenden 
Erfindung zeigt, bei der jede Prozedur oder Schleife skaliert ist in bezug auf die Ausfuhrungszeit ernes gesamten 
Programms; 

Fig. 14 ist ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofildarstellung zeigt, bei der alle 
Prozeduren und Schleif en in gleicher Weise skaliert sind, ungeachtet deren absoluter Aiisfunrungszeiten; 

Fig. 15 ist ein Diagramm, welches ein drittes Beispiel einer Ausfuhrungsprofildarstellung zeigt, in der das 
Ausfuhrungsprofil von jeder Prozedur oder Schleife in einer Kreisgraphik wiedergegeben ist; 

Fig. 16 ist ein Diagramm, welches ein viertes Beispiel der Ausfuhrungsprofildarstellung zeigt, in der das 
Ausfuhrungsprofil in einer Radarkarte wiedergegeben ist; 

Fig. 17 ist ein Diagramm, welches ein funftes Beispiel einer Ausfehrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt; und 

Fig. 18 ist ein Diagramm, welches ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt 

BESCHREIBUNG DER BEVORZUGTEN AUSFUHRUNGSFORM 

Eine Ausfuhrungsform der vorliegenden Erfindung soil nun ira folgenden unter Hinweis auf die beieefueten 
Zeichnungen beschrieben werden. 

Fig. 1 ist eine Konzeptdarstellung eines Leistungsanalysierersystems, in welchem ein Sichtbardarstellverfah- 
ren gemaB der vorliegenden Erfindung angewandt wird. Ein ParaUelrechnersystem 1 1 ist durch eine Vielzahl von 
Prozessoren 12a- 12n aufgebaut, die als Berechnungselemente dienen und die zusammen iaufen, um umfangrei- 
che Berechnungsaufgaben zu erzielen, die in einera Parallelverarbeitungsprogramm codiert sind. Solche Prozes- 
soren 12a- 12n umfassen einzeln Datensammeleinrichtungen 13a- 13n und eine Dateiisummiereinrichtung 
I4a- 14n zum Korngieren und Aufsummieren von jeweiis Ausfuhrungszeitdaten. 

Die Datensammeleinrichtungen 13a- 13n sammeln in einer Real zeitweise die Aushlhrungszeitdaten wahrend 
der Programmausnilunmg m den jeweiligen Prozessoren 12a- 12n, in denen sie auftreten. Die Ausfuhrungszeit- 
daten, die durch die Datensammeleinrichtungen 13a-13n gesammelt wurden, werden als Quellendaten fur die 
Ausruhningsprofile verwendet Die Ausfuhrungsprofile bestehen aus einem Satz von Reports, welche die 
Anwender mit Informationen uber die Prozessoren 12a- 12n, daB diese tatsachlich arbeiten, versehen, wodurch 
diese das Programm von verschiedenen Gesichtspunkten aus bewerten konnen. 

t,m^nm U 0 ;^KMr ofUe - W u Sen C ^ ge bestimmte Programmroutinen hin, welche das ParaUelverarbei- 
tungsprogramm buden, wie beisp.elswe.se Prozeduren, Schieifen, eine parallele Verarbeitungsbibtiothek, die 

SblettVrpfo^ 

einri^fnZ U ^r e ^ inriChtUnge ? 14a - ,4n ^fcren*e Ausfimrungsze«tdaten,diedurchdie Datensammel- 
unTem S2"h • g h esamme,t wurdea S P« ifisch berechnen sie Maximal., Mittel-, Minimalwerte 

^tSSS^^^^^ Ausf *hrungszeiten fur jede Routine oder jedes Subjekt fur die 
durch die 1 of[^Z^^£ e ZU e "V Che Z lst es frforderlich, alle Ausfuhrungszeitdaten zu kompilieren, die 
eine der Sa ™S ? • IT 8 ™ ,3a 7» n emzelnen Stelle gesammelt wurden. Daher befaBtsich 

l*-llSSS3^^T gea 7 ,e b * s P ,e,sweise ,4 * mi * den Summierungsaufgaben und andere 



als ein Teil der Laufeeitbibliothek fur die Parallelverarbeitung vorgesehen smd Bei der vorhegenden Ausfuh- 
rungsform stehen acht Laufzeit-Subroutinen fur diesen Zweck zur Verfugung, wie in Fig. 3 au/gehstet _ ist Die 
detaillierten Funktionen der Datensammeleinrichtungen 13a- 13n und der Datensummiereinnchtungen 
14a-14nsoHengetrenntunterHinweisaiifdieRg.4bisllbeschriebenwerden. 

Um erneut auf Fig. 1 einzugehen, ist das Parallelrechnersystem 11 an zwei Datendateien gekoppelt: eine 
Quellencodedatei 15 und eine Profilinformationsdatei 16. Die Quellencodedatei 15 enthalt den ongraalen Quel- 
lencode eines Programms, welches durch die Prozessoren 12a- 12n ausgefuhrt werden soil Die Profihnforma- 
tionsdatei 16 speichert Ausfuhrongszeitdaten und deren Summendaten, wie sie von den Prozessoren 12a- l2n 

^mnTroffla^eigeprozessor 17 analysiert die Inhalte der Profilinformationsdatei 16 und stellt das Ergebnis 
dieser Analyse in einem Ausfuhrungsprofilfenster 22 auf einera Bildschirm einer Anzeigeeinheit 21 dar. Hier 
macht der Profilanzeigeprozessor 17 das Ergebnis der Analyse sichtbar, und zwar unter Verwendung mehrerer 
graphischer Wiedergabetechniken, wie dies an spaterer Stelle in Verbindung nut den Fig. 13 bis 18 beschneben 
werden solL Eine Eingabevorrichtung 18 wird dazu verwendet um einige Befehle oder Daten in den Profilanzei- 
geprozessor 17 einzugeben. . , . 

Bei Verwendung dieser Eingabevorrichtung 18 kann der Anwender dieses l^istungsanarysierersystems einen 
spezifischen Punkt (z.B. eine Prozedur oder Schleife) bezeichnen, der in dem AusfuhnmgsprofUfenster 22 
dargestellt wird. Ein Quellencode-Posioonsanalysierer 19 sucht nach dem Quellencode, um die Codeposition 
(oder Zeilenzahl) entsprechend dem Punkt herauszufinden, der durch den Anwender bezeicnnet worden ist 
GemaB der Codeposition-Information, die durch den QueUencode-Positionsanalysierer 19 geliefert wird, extra- 
hiert einen Quellencode-Browser 20 den relevanten Teil des Quellencodes 15 und zeigt den extrahierten 
Quellencode in einem Quellencodefenster 23 auf dem Bildschrift der Anzeigeeinheit 21 an. 

Bevor die Programmausfuhrung bei dem oben beschriebenen System gestartet wird, ist es erforderhch, den 
originalen Quellencode in ein ausf uhrbares Programm zu ubersetzen oder zu kompiheren. Bei der vorhegenden 
Erfindung sollte der Quellencode vor der Kompilierung modifiziert werden, und zwar fur Uberwachungs- und 
MeBzwecke. Spezifischer gesagt schiebt das Kompiliersystem Subroutine-Ruf-Zustande in den Quellencode ein, 
um einige Laufzeit-Subroutinen fur die Datensammlung und Summierung an geeigneten Punkten m dem 
Programm aufzurufen. , . _ 

Der QueUencode eines parallel verarbeitenden Programms besitzt eine merarchische Struktur. Das tto- 
gramm oder die Anwender-Anwendung besteht aus einer Vielzahl von Prozeduren. Eine Prozedur ruft einige 
andere Prozeduren auf; mit anderen Worten konnen Prozeduren verschachtelt werden. Als Tatsache ist der 
Hauptkdrper des Programms eine Prozedur, die impiizh als "MAIN" bezeicnnet wird, die mehrere Abkomm- 
lingsprozeduren enthalt Die Schleife besteht aus einer Sequenz von Befehlen als Teil einer Prozedur, die iterativ 
ausgefuhrt werden. 

Um die paralle Programmausfuhrung zu unterstutzen, sieht das System eine Bibliothek von Routinen vor, um 
eine ProzeBkommunikation, Synchronisation und andere Aufgaben auszufflhren, die bei der parallelen Verarbei- 
tung inharent vorkommen. Diese werden als parallel verarbeitende Bibliotheksroutinen bezeichnet, welche 
durch die Prozeduren nach Bedarf aufgerufen werden. Da sie die Systemleistung als parallel laufende Zusatze 
beeinflussen, sind die parallel verarbeitenden Bibliotheksroutinen ein wichtiges Merkmal bei der Ausfuhrung der 
Profilbildung. 

Fig. 2 zeigt ein FluBdiagramm, welches einen ProzeB der Modifizierung und Kompilierung eines Programms 
fur das Parallelrechnersystem 1 1 zeigt Dieser ProzeB enthalt die folgenden sieben Schritte. 

[SI] Es wird der Quellencode eines parallel verarbeitenden Programms, welches in jedem Prozessor in dem 
Parallelrechnersystem 1 1 auszufuhren ist in das Kompilierungssystem eingegeben. 

[S2] Es wird eine Feststellung zum Aufrufen einer Laufzeit-Subrout'me # 1 in den Anfangsteii des Hauptpro- 
grammkorpers eingef Qgt Die Laufzeit-Subroutine # 1 zeichnet die Zeit auf, wenn das Programm gestartet wird. 

[S3] Es werden FeststeUungen zura Aufrufen der Laufzeit-Subroutinen #2 und #3 jeweils in den Anfangsteii 
und in den Endteil jeder Prozedur eingefugt die in dem Quellencode enthalten ist 

[S4] Es werden FeststeUungen zum Aufrufen der Laufzeit-Subroutinen #4 und #5 jeweils in den Anfangsteii 
, und in den Endteil jeder Schleife eingefugt die in den Prozeduren enthalten ist 

[S5] Es werden FeststeUungen zum Aufrufen der Laufzeit-Subroutinen #6 und #7 jeweils in den Anfangsteii 
und in den Endteil jeder parallel verarbeitenden Bibliotheksroutine eingefugt 

[S6] Es wird eine Feststellung zum Aufrufen der Laufzeit-Subroutine #8 in den Endteil des Hauptprogramm- 
korpers eingefugt 

; [S7] Das Kompilierungssystem ubersetzt (oder kompiliert) die Quellencodedatei 15, die nun die bei den 
Schritten S2 bis S6 eingefugten Subroutine-Aufruf-Feststellungen enthalt in den Objektcode, der durch die 
Prozessoren 12a— 12n ausfuhrbar ist 

Durch Ausftlhren der oben erlauterten Schritte SI bis S7 fugt das Kompilierungssystem einige geeignete 
FeststeUungen in die Quellencodedatei 15 ein, um die Laufzeit-Subroutinen fur die Datensammlung und Aufsum- 

> mierung aufzurufen und es kompiliert die Quellencodedatei 15, um den ausfuhrbaren Objektcode zu generieren. 
Als ein Ergebnis enthalt der generierte Objektcode Subroutine-Aufruf-Befehle sowohl an den Start- als auch 
Endpunkten des Hauptprogrammkorpers, der Prozeduren, Schleifen und der parallel verarbeitenden Bibliot- 
heksroutinen. 

Fig. 3 faBt die Laufzeit-Subroutinen, die zum Zweck der Leistungsuberwachung und -analyse eingefuhrt 
5 wurden, zusammen. Die Tabelle 30 beschreibt kurz die Funktionen der acht Laufzeit-Subroutinen in deren 
jeweiligen Gelegenheiten, bei denen sie aufgerufen werden. 

Die in dieser Tabelle aufgelisteten ersten sieben Subroutinen ( # 1 bis # 7) sind Subroutinen, die zum Sammeln 
von Zeitwertzeichendaten und zum Akkumulieren der Ausfuhrungszeit von jedem Abschnitt des Parallelpro- 
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gramms ausgelegt sind Das heiBt, solche Subroutinen #l-#7 entsprechend der Datensammeleinrichtung 
13a- 13n in Fig. 1. Die achte Subroutine #8 besteht aus einer Subroutine, die zum Summieren der Daten 
ausgelegt ist, die durch die Subroutinen #1 bis #7 gesammeit und akkumuliert wurden. Die Subroutine #8 
entspricht sorait der Datensuramiereinrichtung 14a— Mil 

Urn auf die Fig. 4 bis 11 einzugehen, so das folgende hinsichtlich der detaillierten Funktionen der Laufzeit- 
Subroutinen # 1 - # 8 erlautert, die in den Quellencode eingefugt sind. 

Fig. 4 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine # 1 zeigt, die dann aufgerufen wird wenn das 
Programm startet zu lauf en und die zwei folgenden Aufgaben vorsieht 

[SI la] Initialisieren eines ortiichen Datenbereiches,der zum Aufzeichnen und zum Analysieren des Prozessor- 
Verhaltens verwendet wird. 

[SI lb] Aufzeichnen des Programmstartzeitpunktes. 

Die Fig. 5 und 6 sind FluBdiagramme, welche die Laufzeit-Subroutinen #2 bzw. #3 zeigen. Die Laufzeit-Sub- 
routine #2 wird zu Beginn von jeder Prozedur aufgerufen und wie bei dem Schritt S12a von Fig. 5 gezeigt ist, 
zeichnet sie den Ausfuhrungsstartzeitpunkt dieser Prozedur auf. Als ein Gegenstfick zu dieser Subroutine #2 
wird die Laufzeit-Subroutine #3 aufgerufen, wenn die Prozedur beendet wird und sie fuhrt die folgenden drei 
Aufgaben aus: 

[S13a] Erhalten der Ausfuhrungs-Ende-Zeit der Prozedur. 

[S13b] Akkumulieren der Ausfuhrungszeit der Prozedur (das heiBt Akkumulieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der Ausfuhrungs-Ende-Zeitji 

[S13c] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
Prozedur aufgerufen wurde (das heiBt Akkumulieren der Differenz zwischen der Ausfiihrungsstartzeit und der 
Ausfuhrung-Ende-Zeit, die durch die Laufzeit-Subroutinen #6 und #7 fur jede parallel verarbeitende Bibliot- 
heksroutine aufgezeichnet wurde). 

Fig. 7 zeigt ein FluBdiagramm der Laufzeit-Subroutine #4, welche aufgerufen wird, wenn der Prozessor in 
eine Schleife eintritt Die Schleife umfaBt eine Folge von Befehlen, die iterativ ausgefuhrt werden, und zwar 
unter der Steuerung einer Schleifen-Zahler-Variablen. Jedesmal, wenn die Schleife ausgefuhrt wird, wird die 
Schleifen-Zahler- Variable erhoht (oder vermindert), und zwar um ein vorbestimmtes Inkrement und es wird die 
Schleife wiederholt, bis die Schleifen-Zahler- Variable einen vorgeschriebenen Grenzwert erreicht oder andere 
Beendigungsbedingungen erfullt sind Um statistische Ausfuhrungsdaten fur die Schleifen zu sammeln, fuhrt die 
Laufzeit-Subroutine #4 die folgenden zwei Aufgaben durch: 
[S 14a] Aufzeichnen der Ausfuhrungsstartzeit der Schleife. 

[S14b] Erhalten des Anfangswertes der Schleifen-Zahler-Variablen und des Inkrements (oder Schleifenzahler- 
SchrittgroBe) fur jede Iteration, und Aufbewahren derselben fur zukOnftige Verwendung. 

Fig. 8 zeigt ein FluBdiagramm der Laufzeit-Subroutine #5, die ausgefuhrt wird, wenn eine Schleife beendet 
wird Diese f&llt die folgenden vier Aufgaben fur jede Schleife. 
[SI 5a] Erhalten der Ausfuhrung-Ende-Zeit der Schleife. 

[Si 5b] Akkumulieren der Ausfuhrungszeit der Schleife (das heiBt Akkumulieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der Ausfuhrung-Ende-Zeit fur die Schleife). 

[Sl5c] Erhalten des endgultigen Wertes der Schleifensteuer-Variablen und Berechnen der Zahl der Iterationen 
basierend auf den Anf angs- und Endwerten der Schleifen-Zahler-Variablen und der SchrittgroBe. 
[S15d] Akkumulieren der Zahl der Iterationen. 

[S15e] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die durch die 
Schleife aufgerufen wird Hier wird die Ausfuhrungszeit dadurcb erhalten, indem die Ausfuhrungsstartzeit bzw. 
Ausfuhrungsstartzeitpunkt von dem Ausfuhrung-Ende-Zeitpunkt subtrahiert wird die durch die Laufzeit-Sub- 
routinen #6 und #7 fur jede parallel verarbeitende Bibliotheksroutine aufgezeichnet wurden, die von der 
Schleife aufgerufen wurden. 

Die Fig. 9 und 10 zeigen die Laufzeit-Subroutinen #6 und #7, die aufgerufen werden, wenn eine parallel 
verarbeitende Bibliotheksroutine jeweils startet und endet Das heiBt, die Laufzeit-Subroutine #6 fuhrt den 
folgenden Schritt aus: 

[SI 6a] Aufzeichnen des Ausfuhrungsstartzeitpunktes der parallel verarbeitenden Bibliotheksroutine. 

Als Gegenstuck zu dieser Laufzeit-Subroutine # 6 erzeugt die Laufzeit-Subroutine # 7 folgendes: 
[S17a] Erhalten des Ausfuhrungs-Ende-Zeitpunktes der parallel verarbeitenden Bibliotheksroutine. 
[S17b] Akkumulieren der Ausfuhrungszeit der parallel verarbeitenden Bibliotheksroutine, wobei die Ausfuh- 
rungszeit die Differenz zwischen dem AusfiUu-ungsstartzeitpunkt, der bei dem Schritt S16a aufgezeichnet wurde, 
und dem Ausfuhrung-Ende-Zeitpunkt, der bei dem Schritt S17a erhalten wurde, ist 

Fig. 1 1 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine #8 wiedergibt, die am Ende des gesamten 
Programms ausgefuhrt wird Die Laufzeit-Subroutine #8 summiert die Ausfuhrungszeitdaten auf, die durch die 
anderen Laufzeit-Subroutinen # 1 bis # 7 gesammeit wurden, und zwar gemaB den folgenden Schritten: 
[SI 8a] Berechnen der mittleren angesamraelt Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die 
durch jede Prozedur aufgerufen wurde, gemaB den folgenden Gleichungen: 



Tcp(avg) . JLJ] Tcp(m) 
Twp(avg) = ij] Twp (m) 



... (1) 

... (2) 



n 

Top (avg) = Top(ra) — (3) 

worin n eine ganze Zahl ist welche die Anzahl der Prozessoren wiedergibt, die in dem Parallelrechnersystera 1 1 
involviert sind und m eine ganze Zahl ist, die von 1 bis n reicht und dazu verwendet wird, um einen spezifischen 
Prozessor anzuzeigen. Tcp(m) ist die akkumulierte Ausfuhrungszeit welche der m'te Prozessor fur die Kommu- 
nikationsaufgaben verbraucht hat Tcp(avg) bedeutet eine mittlere angesammelte Ausfuhrungszeit, die fur 

to Kommunikationsaufgaben verbraucht wurde. Twp(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Pro- 
zessor fur die Synchronisation verbraucht hat Twp(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit 
die fur Synchronisationsaufgaben verbraucht wurde. Top(m) ist die akkumulierte Ausfuhrungszeit die der m'te 
Prozessor fur Auf gaben verbraucht hat die anders sind als die Koramunikations- und Synchronisationsaufgaben. 
Top(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit die fur andere Aufgaben verbraucht wurde. 

15 [S18b] Berechnen des Maximalwertes, Minimalwertes und der Standardabweichung a fur jede der akkumulier- 
ten Ausfuhrungszeiten Tcp(m), Twp(m) und Top(m). 

[Sl8c] Berechnen der mittleren akkumulierten Ausfuhrungszeit des Anwenderprogramms gemaB der folgenden 
Gleichung: 

20 n 

Tup (avg) = Tup(m) 
«=i 

n 

25 = »Z (T PP (lTl) " TC P (m> _TW P {m) ~ T °P (tU) ) •'• {4) 

m=l 

worin Tpp(m) die Ausfuhrungszeit bedeutet die durch den m'ten Prozessor fur die in Betracht stehende 
Prozedur verbraucht wurde und wobei Tup(m) die Netto-Ausfuhrungszeit des Anwenderprogramms bedeutet 

30 

Tup(m)-Tpp(m)-Tcp(m)-Twp(m)-Top(m)) (5) 

[S18d] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung o fur die akkumulierte 
Ausfuihrungszeit des Anwenderprogramms Tup(m). 
35 [S18e] Berechnen der mittleren angesammelten Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die in 
jeder Schleif e aufgerufen wurde, gemaB den folgenden Gleichungen: 

Tel (avg) = if Tel (m) ... (6) 

Twl(avg) = Twl (m) ...(7) 

45 Tol(avg) = ±£ Tol(m) ...(8) 

Tcl(m) ist die akkumulierte Ausfuhrungszeit die der m'te Prozessor f Or Kommunikationsaufgaben benotigt hat 
so Tcl(avg) bedeutet die mittlere angesammelte Ausfuhrungszeit die fur Kommunikationsaufgaben verbraucht 
wurde. Twl(m) ist die akkumulierte Ausfuhrungszeit die der m'te Prozessor fur die Synchronisation benotigt hat 
Twl(avg) bedeutet die mittlere akkumulierte Ausfuhrungszeit die fur Synchronisationsaufgaben verbraucht 
wurde. Tol(m) ist die akkumulierte Ausfuhrungszeit die der m'te Prozessor fur Aufgaben verbraucht hat, anders 
als die Kommunikations- und Synchronisationsaufgaben. Tol(avg) bedeutet die mittlere akkumulierte Ausfuh- 
55 rungszeit die fur andere Aufgaben verbraucht wurde. 

[S18f] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung o fur jede der akkumu- 
lierten Ausfuhrungszeiten Tcl(m), Twl(m) und ToKjm> 

[S18g] Berechnen der mittleren angesammelten Ausfuhrungszeit des Anwenderprogramms gemaB der folgen- 
den Gleichung: 

60 

Tul(ave) = Tul (m) 

= ~ 2 (Tpl (m) -Tel (ra) -Twl (m) -Tol (m) ) ... (9) 

m=l 
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worm Tpl(m) die Ausfuhrungszeit ist die von dem m'ten Prozessor fur die in Betracht stehende Schleife 
verbraucht wurde und Tu!(m) die akkumulierte Netto-Ausfuhrungszeit des Anwenderprogramms ist 

Tul(m)-Tpl(m)-Tcl(m)-Twl(m)-Tol(ni)) (5) 

[S18h] Berechnen des Maximalwertes, des Minimaiwertes und der Standardabweichung a fur die akkumulierte 
Ausfuhrungszeit des Anwenderprogramms Tul(ra). 

[S18i] Ausgeben der Ergebnisse der Schritte S18a bis S18h als eine Profil-Informationsdatei 16. 

Fig. 12 zeigt eine Tabelle, die die Informationen zusammenfaBt weiche durch das Leistungsanalysierersystem 
der vorliegenden Erfindung gesammelt wurden. In dieser Tabelle 40 sind die gesammelten Informationen in io 
Einklang mit dem Subjekt der Profilierungsoperationen klassifiziert, weiche Prozeduren, Schleifen und parallel 
verarbeitende Bibiiotheksroutinen enthalten, um die Kommunkation, Synchronisation und andere Aufgabenzu 
unterstutzen. Obwohl in Fig. 12 nicht gezeigt konnten bedingte Programmverzweigung auch in dem ProfHsub- 
jekt enthalten sein. 

Im allgemeinen werden Informationen, weiche das Programmverhalten in jedem Prozessor betreffen, an drei is 
verschiedenen Stufen der Ausfuhrung gesammelt: einer vorbereitenden Verarbeitungsstufe, einer Anlauf- Verar- 
beitungsstufe und einer Datenverarbeitungsstufe (terminal process staged 

Die vorbereitende Verarbeitungsstufe besteht aus einer Stufe, bevor eine bezeichnete Routine als Profilsub- 
jekt aufgerufen wird. Die drei Arten der Profil-Subjekte, die in der Tabelle 40 aufgelistet sind, erfordern es 
jedoch nicht, daB Informationen an der vorbereitenden Verarbeitungsstufe gesammelt werden. Wie oben 20 
dargelegt wurde, konnen auch bedingte Programmverzweigungen (in Fig. 7 nicht gezeigt) ein Ziel der Ausfuh- 
rungsprofilierung sein. Wenn dies der Fall ist, werden zusatzliche Befehle in den Quellencode eingefuhrt, um eine 
andere Laufzeit-Subroutine aufzurufen, um Informationen an aktueBen Verzweigungsbedingungen zu sarameln. 
Speziell enthalten solche Verzweigungsbedingungen "Wahr- oder FaIsch-"Bedingungen als Ergebnis von logi- 
schen Operationen oder "negative, Null- oder positive" Bedingungen als ein Ergebnis von arithmetischen 25 
Operationen, die vor den Verzweigungsbefehlen ausgefuhrt wurden. Die Laufzeit-Subroutine zahlt das Auftre- 
ten von jeder soldier Bedingungen, bevor eine Verzweigung durchgefuhrt wird, namlich bei der vorbereitenden 
Verarbeitungsstufe. 

Die Anlauf- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine, die bei einem Profil-Subjekt 
beteiligt ist, zu laufen beginnt Spezieller gesagt, wird die Ausfuhrungsstartzeit an der Anlauf- Verarbeitungsstufe 30 
von jeder Prozedur (siehe SI 2a in Fig. 5), Schleife (siehe S14a in Fig. 7) oder parallel verarbeitenden Bibliotheks- 
routine (siehe S16a in Fig. 9) aufgezeichnet Im Falle der Schleifen wird der Anfangswert einer Schleifenzahler- 
Variablen und einer SchleifenzaWer-SchrittgroBe zusatzlich zu der Ausfiihrungsstartzeit (siehe S14b in Fig. 7) 
aufgezeichnet 

Die Datenverarbeitungsstufe oder Ende- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine 3s 
dabei ist zu enden. Bei der Ende- Verarbeitungsstufe jeder Prozedur werden die Ausfuhrungszeit der Prozedur 
und die Ausfuhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die innerhalb der Prozedur 
aufgerufen wurde, akkumuliert (siehe S13b und S13c in Fig. 6X wodurch die akkumulierten Ausfuhrungszeiten 
Tppfm), Tcp(m), Twp(m) und Top(m) erhalten werdea In ahnlicher Weise werden bei der Ende-Verarbeitungs- 
stufe einer Schleife die Ausfuhrungszeit der Schleife und die Ausfuhrungszeit jeder parallel verarbeitenden 40 
Bibliotheksroutine, die innerhalb der Schleife aufgerufen wurde, akkumuliert (siehe S15b und S15e in Fig. 81 
wodurch die akkumulierten Ausfuhrungszeiten Tpl(m)t Tcl(m), Twl(m) und ToI(m) fur die Schleife erhalten 
werden. Zusatzlich wird bei der Ende-Verarbeitungsstufe von jeder Schleife die Zahl der Iterationen ebenso 
akkumuliert In bezug auf die parallel verarbeitenden Bibiiotheksroutinen wird die Ausfuhrungszeit von jeder 
Routme bei der Ende-Verarbeitungsstufe (siehe S17b in Fig. 10) akkumuliert 45 

Die bei den oben beschriebenen drei ProzeBstufen gesammelten Informationen werden am Ende des Pro- 
gramms summiert und werden dann als eine Profil-Informationsdatei 16 ausgegeben. Zum Wiederauffinden der 
summierten Informationen aus der Profil-Informationsdatei 16 bietet der Profilanzeigeprozessor 17 Ausfuh- 
rungsprofilsummen dem Anwender dieses Systems an. Um den Anwender mit einer verstandlichen und informa- 
tiven Anzeige zu versehen, verwendet der Profilanzeigeprozessor 17 verschiedene DarsteUungsverfahren,die im 50 
folgenden beschrieben werdea 

j R t I 3 I eigt ein Dia g ramm ' welches ein erstes Beispiel der aus Ausfuhrungsprofilanzeige nach der vorliegen- 
den Erfindung veranschaulicht In diesem Fall bildet die Prozedur # 1 den Hauptkorper des unter Test stehen- 
den parallel verarbeitenden Programms und es werden die Balkengraphiken fur die anderen Prozeduren und 
Jn P^a^m's) Ausfuhrungszeit der Prozedur # 1 skaliert (das heiBt die Ausfuhrungszeit des gesara- 55 

Die Ausfuhrungsprofilanzeige, die in fig. 13 veranschaulicht ist enthalt Informationen hinsichtlich der Proze- 
duren # 1, # 2 usw. und hinsichtlich der Schleifen # 1, #2 usw. Jede Balkengraphik ist in vier Teile eingeteUt: die 
Anwenderprogramm-Ausfuhrungszeit Tu, die Kommunikationsaufgabe-AusfQhrungszeit Tc, die Synchronisa- 
S ^ If C U ^ mgSZek Tw und eine andere Aufgaben-Ausfuhrungszeit To. Die Aufteilung wird durch eo 
Ausfur^nSeifea 1 " 0265501 " " vorgenommen ' und zwar im E5nk3an g mit Mittelwerten der angesammelten 

Dhiken Qbrrl a S;tto E H ?ebniSSe s ^ tistischen Ana, yse «r jede Ausfuhrungszeitkategorie auf den Balkengra- 
Werte STSE S2f T'"™ 3 ! 6 " Werte u mit e, . nem Sternchenzeichen - wiedergegeben sind, die maximalen 
LiSm^nt Jh 3 ^ u wiedergegeben sind und die Standardabweichungen mit einem horizontalen 65 
Limensegment wiedergegeben sind, welches zwischen diesen gezeichnet ist 

B^^SS^iZl^A AusfQhrun S«tat«tiken erlaubt es dem Anwender, in einfacher Weise die 
Beziehung zwischen dem Anwenderprogramm und parallel verarbeitenden Zusatzen, inklusive Kommunika- 
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tions- und Synchronisationsaufgaben zu unterscheidea DarOber hinaus kann der Anwender durch das Vorsehen 
der Maximum-, Minimum- und Standardabweichungssymbole auf einen Bfick erkennen, in welcher Weise die 
Prozentsatze aktuell schwanken. Dieses Merkmal hilft dem Anwender sehr, das Verhalten der Prozeduren und 
Schleifen zu verstehen, die in einem parallel verarbeitenden Programm enthalten sind, so daB dieser die 
Moglichkeit erhalt, zu beobachten, ob das Programm richtig arbeitet oder nicht und die Entscheidung treffen 
kann, ob weitere Programm-Modifikationen erforderlich sind oder nicht, um eine Qualitatsverbesserung zu 
erreichen. 

Fig. 14 zeigt ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofilanzeige wiedergibt Im Gegen- 
satz zu dem ersten in Fig. 13 gezeigten Beispiel, werden bei dem Verfahren nach dem zweiten Beispiel alle 
Prozeduren und Schleifen in den individueUen ZeitmaBstSben sichtbar gemacht, ungeachtet von deren absoluten 
Ausfuhrungszeiten. Das heiBt, die Langen der Balkengraphiken sind nicht proportional zu deren jeweiligen 
Ausfuhrungszeitlangen. Die Graphiken in Fig. 14 erlauben es jedoch, daB der Anwender auf einfache Weise die 
Prozentsatze der Programmkomponenten verstehen kann (das heiBt Anwenderprogramm Tu, Kommumka- 
tionsaufgabe Tc, Synchronisationsaufgabe Tw und andere Aufgaben To), die in jeder Prozedur oder Scbleife 
involviertsind. 

Fig. 15 zeigt ein drittes Beispiel einer AusfuhrungsproFdanzeige, bei der zwei Prozeduren # 1 und #2 in Form 
einer Kreisgraphik wiedergegeben sind Kreisgraphiken erlauben hn allgemeinen, daB der Anwender die Bezie- 
hung von Komponenten zu einer Gesamtheit einfacher vergleichen kann. Bei diesem dritten Anzeigeverfahren 
zeigt ein gesamter Kreis von 360 Grad die gesamte akkumulierte Ausf uhrungszeit einer Prozedur oder Scbleife 
und vier Sektoren zeigen die Prozentsatze der Anwendeiprogramm-Ausfiuirungszeit (Tu), der Kommunika- 
tionsaufgabe-Ausfuhrungszeit (Tc), der Synchjonisatiomaufgabe-Ausfuhrungszeit (Tw) und der anderen Aufga- 
be-Ausfuhrungszeit (To) an. 

Fig. 16 zeigt ein viertes Beispiel einer Ausfuhrungsprofilanzeige, bei der das Ausfuhrungsprofil in Form emer 
Radarkarte wiedergegeben ist Die Radarkarte in Fig. 16 besitzt vier Achsen entsprechend den vier Programm- 
komponenten. Die akkumulierten Ausfuhrungszeitwerte (Tu, Tc Tw und To) der Programmkomponenten sind 
auf deren jeweiligen Achsen aufgetragen und die aufgetragenen Punkte sind miteinander verbunden, am ein 
Polygon zu bilden. Aus der Gestalt dieses Polygons kann der Anwender intuitiv die Figenschaften der Prozedur 
oder Scbleife verstehen, die in einer Radarkarte proffliert sind. . 

Ahnlich den anderen Anzeigeverfahren, die soweit beschrieben wurden, umfaBt die Radarkarte, die in Fig. 16 
veranschaulicht ist, Infonnationen hinsichtlich der Minimal- und Maximalwerte und der Standardabweichung 
der akkumulierten Ausfuhrungszeit Dieses Merkmal erm5glicht es dem Anwender, das Verhalten jeder Pro- 
granunkomponente in einem detaillierteren Wert zu verstehen. 

Fig. 17 zeigt ein funftes Beispiel einer Ausfuhrungsprofilanzeige gemaB der vorliegenden Erfindung. Hn 
Ausfuhrungsprofilfenster 50 besteht aus vier Abschnitten 50a bis 50& Der erste Abschnitt 50a enthalt die 
Legende der Balkengraphiken, die in den anderen Abschnitten des Fensters 50 dargestellt sind. Spezieller gesagt, 
definiert die Legende die Farbklassifizierung fur vier verschiedene Programmkomponenten, die bezeichnet sind 
mit: 

Anwender: Anwenderprogramm. 
Com: Kommunikationsaufgabe-Routine. 
Sync: Synchronisationsaufgabe-Routine. 
Runlib und Gop: andere Routinen. 

Das Ausfuhrungsprofilfenster 50 bei dem fQnften Beispiel verwendet diese Farbklassifizierung zusammen mit 
dem DarsteUungsverfahren wie in Fig. 13. 

Der zweite Abschnitt 50b des Ausruhrungsprofilfensters 50 zeigt ein prozedur-gestutztes Ausfuhrungsproru, 
welches die akkumulierten Ausfuhrungszeiten von mehreren Prozeduren, wie beispielsweise "MAIN", "calcl", 
"calc2", "cputira" und "initaL", auf summiert. 

Der dritte Abschnitt 50c des AusfuhrungsprofUfensters 50 zeigt ein fang-gestGtztes (caller-based) Ausfuh- 
rungsprofil, welches die akkumulierte Ausfuhrungszeit von jeder Prozedur zusammen mit dem Namen von 
dessen Fang-Routine (caller routine) zusammenfaBt Beispielsweise liest sich die oberste Zeile dieses Abschnitts 
wie folgt: 

calcl < 1032s > MAIN < UNSPECIFIED 

worm das links bezeichnete "calcl" der Name der Prozedur ist, die durch eine Fang-Routine "MAIN" gerufen 
wurde. Das am weitesten rectus gelegene Zeichen" < UNSPECIFIED" bedeutet, daB die Fang-Routine nicht 
ihren eigenen Programmnamen deklariert und der inharente Name "MAIN" durch das Analysierersystem 
verwendet wird. Die Zeile zeigt auch an, daB die akkumulierte Ausfuhrungszeit dieser Prozedur "calcl" gleich 
10,292 Sekunden betragt 

Die Balkengraphik fur diese "calcr-Prozedur ist farb-klassifiziert gemaB der Legende, die in dem ersten 
Abschnitt 50a definiert ist, wobei vier Teile der Balkengraphik jeweils die akkumulierten Ausfuhrungszeiten Tu, 
Tc Tw und To zeigt, und zwar zusammen mit der Anzeige des Minimums, Maximums und der Standardabwei- 
chung. 

Der vierte Abschnitt 50d des Ausfuhrungsprofilfensters 50 zeigt ein rufer-gestutztes Ausfuhrungsprofil. 
Beispielsweise liest sich die oberste Zeile des Abschnitts 50d wie folgt: 

MAIN < UNSPECIFIED inital 

worm die Angabe "MAIN < UNSPECIFIED" den Namen einer Rufer-Routine zeigt und die andere Aufschrift 
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"inital" den Namen einer gerufenen Prozedur anzeigt Die Balkengraphik fur diese "initaF-Prozedur ist farb-klas- 
sifiziert gemaB der in dem ersten Abschnitt 50a definierten Legende. Sie besteht aus vier Teilen, die jeweils die 
akkumulierten Ausfuhrungszeiten Tu, Tc, Tw und To als auch deren Minimum- und Maximumwerte und 
Standardabweichung mit den zuvor erwahnten Symbolen zeigea 

Rg. 18 zeigte ein sechstes Beispiel der AusfuhningsprofildarsteUung gemaB der vorliegenden Erfindung. En 5 
Ausfiihrungsprofilfenster 60 besteht aus vier Abschnitten 60a bis 60d Der erste Abschnitt 60a liefert die 
Legende von Balkengraphiken, die in den anderen Abschnitten des Fensters 60 dargestellt werden und spezieller 
definiert ist die Farbklassifikation fur vier Programmkomponenten, die bezeichnet sind mit: 
Anwender: Anwenderprogramm. 

Com: Kommunikationsaufgabe- Routine. to 
Sync: Synchronisationsaufgabe- Routine. 
Runlib und Gop: andere Routinen. 

Die Legende umfaBt auch die Farbklassifizierung fur Verzweigungsbedingungen, die enthalt "Wahr"- und 
"Falsch'-Bedingungen fur logische Operationen und "negative", "Null-" und "positive" Bedingungen fur arithmeti- 
sche Operationen. 15 

Der zweite Abschnitt 60b des Ausfuhrungsprofilfensters 60 zeigt ein Ausfiuirungsprofil, welches die akkumu- 
lierten Ausfuhrungszeiten fur mehrere Schleifen zusammenfaBt 

Der dritte Abschnitt 60c des Ausfuhrungsprofilfensters 50 zeigt ein AusfQhrungsprofil, welches die Verzwei- 
gungsbedingungen zusammenfaBt Die obere Balkengraphik in dem dritten Abschnitt 60c veranschaulicht die 
Prozentsatze von "Wahr"-Bedingungen und "Falsch'-Bedingungen, die tatsachlich als ein Ergebnis der Iogischen 20 
Operationen aufgetreten sind. Die hintere Balkengraphik veranschaulicht die Prozentsatze von "positiven", 
"Null-" und "negativen" Bedingungen, die tatsachlich als ein Ergebnis der arithmetischen Operationen aufgetre- 
ten sind. 

Der vierte Abschnitt 16d des Ausfuhrungsprofilfensters 60 liefert ein gerufenen-gestiitztes (caller-based) 
Ausf uhrungsprofil welches das gleiche ist wie bei dem dritten Abschnitt 50c in Fig. 17. 25 

Zusammenfassend fur die Fig. 12 bis 17 gibt die voriiegende Ausfuhrungsform die Ergebnisse der Leistungs- 
analyse wieder, und zwar unter Verwendung einer Vielfalt von Darstellungsverfahren. Neben der Moglichkeit 
die mittlere Ausfuhrungszeit von jeder Subjekt-Routine darstellen zu konnen, zeigt das voriiegende Analysierer- 
system die Maximum-, Minimum- und Standardabweichung der Ausfuhrungszeiten, wodurch der Anwender die 
Moglichkeit erhalt, mit einem Buck zu erkennen, wie die Prozentsatze tatsachlich schwanken. 30 

Bei der vorliegenden Ausfuhrungsform analysiert das Leistungsanalysierersystem das Parallelrechnersystem 
1 1 (siehe Fig. 1), welches aus vielfachen Prozessoren # 1 bis #n besteht Jedoch kann die voriiegende Erfindung 
auch auf ein einzelnes Prozessorsystem angewandt werden, welches vielfache Aufgaben ausfuhrt, und zwar 
durch Verwendung eines Zeitteiiungsverfahrens. In diesem Fall sammeln mehrere geeignete Laufzeit-Subrouti- 
nen AusfQhrungsdaten fur einzelne Prozesse oder Module, welche virtuell parallel laufen und das Leistungsana- 35 
lysierersystem summiert die gesammelten Daten auf und stellt die Ergebnisse als AusfuJirungsprofile dar. Wie 
bei der vorliegenden Ausfuhrungsform zeigt das AusfQhrungsprofil, welches auf einem Bildschinn dargestellt 
wird, mittlere, Minimum- und Maximura-Ausfuhrungszeiten und die Standardabweichung von dem Mittelwert 
hinsichtiich der Subjektprozesse oder Module. 

Die vorangegangene Beschreibung dient lediglich der Veranschaulichung der Prinzipien der vorliegenden 40 
Erfindung. Da ferner vielfaltige Modifikationen und Anderungen fur den Fachmann offensichtlich sind, ist nicht 
beabsichtigt, die Erfindung auf die exakte Konstruktion und Anwendungen zu beschranken, die beschrieben 
wurden, und demzufolge fallen alle geeigneten Modifikationen und Squivalenten Ausfuhrungen in den Rahmen 
der Erfindung gemaB den anhangenden Anspruchen und deren Aquivalente. 

45 

Patentanspruche 

1. Verfahren zur sichtbaren Darstellung von Ergebnissen einer LeistungsQberwachung und -analyse hlr ein 
Parallelrechnersystem, bei dem eine Vielzahl von Prozessoren ein parallel verarbeitendes Programm aus- 
fuhren, welches aus einer Vielzahl von Routinen zusammengesetzt ist, wobei das Verfahren die folgenden 50 
Schritte umfaBt: 

(a) Sammeln von Informationen hinsichtiich der Ausfuhrungszeit von jeder Routine, die gleichlaufend 
durch eine Vielzahl von Prozessoren ausgefuhrt wird, unter Berucksichtigung der Klassifizierung der 

Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwertes, eines Minimalwertes und einer Standardabwei- 55 
chung der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vielzahl der 
Prozessoren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-Information, welche den Maximalwert, den Mittel- 
wert und den Minimalwert und die Standardabweichung der Ausfuhrungszeit jeder Routine enthalt 

2. Verfahren nach Anspruch !, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine akkumu- 50 
hen wird, jedesmal, wenn die Routine aufgerufen und ausgefuhrt wird 

3. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine gesam- 
melt wird, die als em Subjekt der Profilierung bezeichnet wurde. 

4. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Routinen in ein Anwenderprogramm, 
jCommunikationsaufgaben, Synchronisationsaufgaben und andere Aufgaben klassifiziert werden. 6 5 

5. Verfahren nach Anspruch 3, bei dem das Subjekt der Profilierung Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalt 

6. Verfahren nach Anspruch 1 , bei dem bei dem Schritt (b) ferner die Standardabweichung der Ausfuhnings- 



zeit von jeder Routine zusatzlich zu dera Maximalwert, dem Mittelwert und dem Minimalwert berechnet 

7. Verfahren nach Anspruch 1, bei dera bei dem Schritt (c) Rufer-Routinen und/oder Geruf ener-Routlnen 
aus den Routinen in dem parallel verarbeitenden Programm extrahiert werden und die Ausfuhrungsprofil- 
information, welche zu den extrahierten Routinen gehort, dargestellt wird. 

8. Verfahren nach Anspruch 1 , bei dem bei dem Schritt (c) eine Balkengraphik verwendet wird, um graphisch 
die Ausruhrungsprofilinformation von jeder Routine darzustellen. 

9. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Kreisgraphik verwendet wird, um graphisch 
die Ausf uhrungsprofilinformation von jeder Routine darzustellen. 

10. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Radar karte verwendet wird, um die 
Ausfuhrungsprofilinformation von jeder Routine graphisch darzustellen. 

1 1 . Verfahren nach Anspruch 1, welches ferner die folgenden Schritte umfaBt: 

(d) Annehmen einer Bezeichnung eines Punktes der Aushlhrungsprofilinformation, die bei dem Schritt 
(c) dargestellt wird, und 

(e) Darstellen eines Teiles des Quellencodes des parallel verarbeitenden Programms, welches dem 
bezeichneten Punkt der Ausfuhrungsprofilinforraation entspricht 

11 Ein computer-lesbares Medium, welches mit einem Computer-Programm codiert ist, bei dem das 
Verfahren nach Anspruch 1 iraplementiertist 
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